检索结果

Select

1. 基于元网络的自动国际疾病分类编码模型

周晓敏, 滕飞, 张艺

《计算机应用》唯一官方网站 2023, 43 (9): 2721-2726. DOI: 10.11772/j.issn.1001-9081.2022091388

摘要（253）

HTML （11）

PDF （1032KB）（104）

国际疾病分类（ICD）编码的频率分布呈现出长尾的情况，因此，对少样本编码进行多标签文本分类极具挑战性。针对少样本编码分类中训练数据不足的问题，提出了一种基于元网络的自动ICD编码模型（MNIC）。首先，将特征空间中的实例和语义空间中的特征拟合到同一个空间进行映射，并将频繁编码的特征表示映射到它的分类器权重上，从而通过元网络学习到元知识；然后将学习到的元知识从数据丰富的频繁编码转移到数据贫乏的少样本编码；最后，为元知识的可转移性和通用性提供了合理的解释。在MIMIC-Ⅲ数据集上的实验结果表明，与次优的AGM-HT（Adversarial Generative Model conditioned on code descriptions with Hierarchical Tree structure）模型相比，MNIC将少样本编码的Micro-F1与曲线下面积（Micro-AUC）分别提高了3.77和3.82个百分点，显著提高了少样本编码分类的性能。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 基于深度自编码的医疗命名实体识别模型

侯旭东, 滕飞, 张艺

《计算机应用》唯一官方网站 2022, 42 (9): 2686-2692. DOI: 10.11772/j.issn.1001-9081.2021071317

摘要（227）

HTML （18）

PDF （979KB）（100）

针对在医疗命名实体识别（MNER）问题中随着网络加深，基于深度学习的识别模型出现的识别精度与算力要求不平衡的问题，提出一种基于深度自编码的医疗命名实体识别模型CasSAttMNER。首先，使用编码与解码间深度差平衡策略，以经过蒸馏的Transformer语言模型RBT6作为编码器以减小编码深度以及降低对训练和应用上的算力要求；然后，使用双向长短期记忆（BiLSTM）网络和条件随机场（CRF）提出了级联式多任务双解码器，从而完成实体提及序列标注与实体类别判断；最后，基于自注意力机制在实体类别中增加实体提及过程抽取的隐解码信息，以此来优化模型设计。实验结果表明，CasSAttMNER在两个中文医疗实体数据集上的F值度量可分别达到0.943 9和0.945 7，较基线模型分别提高了3个百分点和8个百分点，验证了该模型更进一步地提升了解码器性能。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

3. 基于稀疏降噪自编码器的深度置信网络

曾安, 张艺楠, 潘丹, Xiao-Wei Song

计算机应用 2017, 37 (9): 2585-2589. DOI: 10.11772/j.issn.1001-9081.2017.09.2585

摘要（676）

PDF （841KB）（675）

传统的深度置信网络（DBN）采用随机初始化受限玻尔兹曼机（RBM）的权值和偏置的方法初始化网络。虽然这在一定程度上克服了由BP算法带来的易陷入局部最优和训练时间长的问题，但随机初始化仍然会导致网络重构和原始输入的较大差别，这使得网络无论在准确率还是学习效率上都无法得到进一步提升。针对以上问题，提出一种基于稀疏降噪自编码器（SDAE）的深度网络模型，其核心是稀疏降噪自编码器对数据的特征提取。首先，训练稀疏降噪自编码；然后，用训练后得到的权值和偏置来初始化深度置信网络；最后，训练深度置信网络。在Poker Hand 纸牌游戏数据集和MNIST、USPS手写数据集上测试模型性能，在Poker Hand数据集下，方法的误差率比传统的深度置信网络降低46.4%，准确率和召回率依次提升15.56%和14.12%。实验结果表明，所提方法能有效地改善模型性能。

参考文献 | 相关文章 | 多维度评价